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(57) Abstract: According to the invention, in order to characterise an information signal having an amplitude-time course with local 
values, the local extreme values of the information signal are determined (10), a local extreme value being defined by a 
and an amplitude. Surface information of highs or lows of the information signal is then determined (11) in the event of 
a unidimensional amplitude of the information signal, or volume information of lows or highs is determined (11) in the event of a 
two-dimensional amplitude of the information signal. A low or a high is defined by a temporal section of the information signal, 
said section extending from the moment of a local extreme value to a temporally adjacent value of the information signal, which has 
the same amplitude as the local extreme value. Surface or volume information of a plurality of highs and lows is characteristic of the 
information signal and enables a broader characterisation of the information signal, the construction of an information signal database 
or the identification of an information signal by means of an existing information signal database. Surface or volume information is 
both characteristic of the information signal and is resistant, due to its integral nature, to information signal variations in the form of 
overlays or distortion. 

[Fortsetzung auf der naehsten Seite] 
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(57) Zusammenfassung: Zum Charakterisieren eines Tnformationssignals, das einen Amplituden-Zeit-Verlauf mit lokalen Fxtrem- 
werten aufweist, werden zunachst die lokalen Extremwerte des Informationssignals bestimmt (10), wobei ein lokaler Extremwert 
durch einen Zeitpunkt und eine Amplitude definiert ist. Ferner werden Flacheninformationen von Talern oder Bergen des Infor- 
mationssignals im Falle einer eindimensionalen Amplitude des Tnfor-mationssignals oder Volumeninformationen im Falle einer 
zweidimensionalen Amplitude des Informationssignals von Bergen oder Talern ermittelt (11). Ein Tal oder Berg ist durch einen 
zeitlichen Abschnitt des Informationssignals definiert, wobei sich der Abschnitt des Informationssignals von dem Zeitpunkt eines 
lokalen Fxtremwerts bis zu einem zeiflich benachbarten Wert des Tnformationssignals erstreckt, der die gleiche Amplitude wie der 
lokale Extremwert aufweist. Flachen- oder Volumeninformationen von mehreren Bergen oder Talern sind fur das Informationssignal 
charakteristisch und erlauben eine weitergehende Charakterisierung des Informationssignals, einen Aufbau einer Informationssig- 
nal-Datenbank oder eine Identifikation eines Informationssignals anhand einer bestehenden Informationssignal-Datenbank. Flachen- 
bzw. Volumeninformationen sind einerseits charakteristisch fur das Informationssignal und andererseits aufgrund ihrer integralen 
Natur robust gegeniiber Informationssignalveranderungen in Form von Uberlagerungen oder Verzerrungen. 
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Vorrichtung und Verfahren ztam Charakterisieren eines Infor- 
mations s ignals 

5 Beschreibung 

Die vorliegende Erfindung bezieht sich auf die Verarbeitung 
von Inf ormationssignalen und insbesondere auf die Merk- 
malsextraktion von Inf ormationssignalen beispielsweise zur 
10 Charakterisierung der Inf ormationssignale oder zur Identi- 
fikation und Datenbanksuche . 

Konzepte, durch die Zeitsignale mit einem harmonischen An- 
teil, wie z. B. Audiodaten, identif izierbar und referen- 

15 zierbar sind, sind fur viele Anwender niitzlich. Insbesonde- 
re in einer Situation, in der ein Audiosignal vorliegt, 
dessen Titel und Autor unbekannt sind, ist es oftmals wiin- 
schenswert, herauszufinden, von wem das entsprechende Lied 
stammt. Ein Bedarf hierzu besteht beispielsweise, wenn der 

20 Wunsch vorhanden ist, z. B. eine CD des betreffenden Inter- 
preten zu erwerben. Wenn das vorliegende Audiosignal ledig- 
lich den Zeitsignalinhalt umfaBt, jedoch keinen Namen uber 
den Interpreten, den Musikverlag etc., so ist eine Identi- 
fizierung des Ursprungs des Audiosignals bzw. von wem ein 

25 Lied stammt, nicht moglich. Die einzige Hoffnung bestand 
dann darin, das Audiostiick samt Ref erenzdaten beziiglich des 
Autors oder der Quelle, wo das Audiosignal zu erwerben ist, 
noch einmal zu horen, um dann den gewunschten Titel be- 
schaffen zu konnen. 

30 

Im Internet ist es nicht moglich, Audiodaten unter Verwen- 
dung herkommlicher Suchmaschinen zu suchen, da die Suchma- 
schinen lediglich mit textuellen Daten umgehen konnen. Au- 
diosignale bzw. allgemeiner gesagt, Zeitsignale, die einen 
35 harmonischen Anteil haben, konnen durch solche Suchmaschi- 
nen nicht verarbeitet werden, wenn sie keine textuellen 
Suchangaben umfassen. 
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Ein realistischer Bestand an Audiodateien liegt bei mehre- 
ren tausend gespeicherten Audiodateien bis zu hunderttau- 
senden von Audiodateien. Musikdatenbankinf ormationen konnen 
auf einem zentralen Internet-Server abgelegt sein, und po- 
5 tentielle Suchanfragen konnten iiber das Internet erfolgen. 
Alternativ sind bei heutigen Festplattenkapazitaten auch 
die zentrale Musikdatenbanken auf lokalen Festplattensyste- 
men von Benutzern denkbar. Es ist wiinschenswert , solche Mu- 
sikdatenbanken durchsuchen zu konnen, urn Ref erenzdaten iiber 
10 eine Audiodatei zu erfahren, von der lediglich die Datei 
selbst, jedoch keine Ref erenzdaten bekannt sind. 

Daruber hinaus ist es gleichermaflen wiinschenswert, Musikda- 
tenbanken unter Verwendung vorgegebener Kriterien durchsu- 
chen zu konnen, die beispielsweise dahingehend lauten, ahn- 
liche Stiicke herausfinden zu konnen. Ahnliche Stiicke sind 
beispielsweise die Stiicke mit einer ahnlichen Melodie, ei- 
nem ahnlichen Instrumentensatz, oder einfach mit ahnlichen 
Gerauschen, wie z. B. Meeresrauschen, Vogelgezwitscher, 
mannliche Stimmen, weibliche Stimmen, etc. 

Das U.S. -Patent Nr. 5,918,223 offenbart ein Verfahren und 
eine Vorrichtung fur eine Inhalts-basierte Analyse, Spei- 
cherung, Wiedergewinnung und Segmentierung von Audioinfor- 
25 mationen. Dieses Verfahren beruht darauf, mehrere akusti- 
sche Merkmale aus einem Audiosignal zu extrahieren. Gemes- 
sen werden Lautstarke, Bali, Tonhohe, Brightness und Melfre- 
quenz-basierte Cepstral-Kof f izienten in einem Zeitfenster 
bestimmter Lange in periodischen Intervallabstanden . Jeder 
3 0 Meftdatensatz besteht aus einer Folge von gemessenen Merk- 
malsvektoren . Jede Audiodatei ist durch den kompletten Satz 
der pro Merkmal berechneten Merkmalsf olgen spezif iziert . 
Ferner werden die ersten Ableitungen fur jede Folge von 
Merkmalsvektoren berechnet. Dann werden statistische Werte 
35 wie Mittelwert und Standardabweichung berechnet. Dieser 
Satz von Werten wird in einem N-Vektor, d. h. einem Vektor 
mit n Elementen, gespeichert. Diese Vorgehensweise wird auf 
eine Vielzahl von Audiodateien angewendet, urn fur jede Au- 



15 



20 
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diodatei einen N-Vektor abzuleiten. Damit wird nach und 
nach eine Datenbank aus einer Vielzahl von N-Vektoren auf- 
gebaut. Aus einer unbekannten Audiodatei wird dann unter 
Verwendung derselben Vorgehensweise ein Such-N-Vektor ext- 
5 rahiert. Bei einer Suchanfrage wird dann eine Abstandsbe- 
rechnung des vorgegebenen N-Vektors und der in der Daten- 
bank gespeicherten N-Vektoren ermittelt. SchlieBlich wird 
der N-Vektor ausgegeben, der den minimalen Abstand zu dem 
Such-N-Vektor hat. Dem ausgegebenen N-Vektor sind Daten ii- 
10 ber den Autor, den Titel, die Beschaf f ungsquelle etc. zuge- 
ordnet, so dafi eine Audiodatei hinsichtlich ihres Ursprungs 
identif iziert werden kann. 

Dieses Verfahren hat den Nachteil, daJ3 mehrere Merkmale be- 
15 rechnet werden und willkiirliche Heuristiken zur Berechnung 
der KenngroJien eingefiihrt werden. Durch Mittelwert- und 
Standardabweichungsberechnungen iiber alle Merkmalsvektoren 
fur eine gesamte Audiodatei wird die Information, die durch 
den zeitlichen Verlauf der Merkmalsvektoren gegeben ist, 
20 auf wenige MerkmalsgroBen reduziert. Dies fiihrt zu einem 
hohen Inf ormationsverlust . 

Grundsat zlich haben alle sogenannten Features bzw. Merkma- 
le, die zur Identif ikation von Inf ormationssignalen einge- 

25 setzt werden, zwei gegenlaufige Anf orderungen zu erfiillen. 
Die eine Anforderung besteht darin, eine moglichst gute 
Charakterisierung eines Inf ormationssignals zu liefern. Die 
andere Anforderung besteht darin, daJJ das Merkmal Oder Fea- 
ture nicht besonders viel Speicherplatz in Anspruch nehmen 

3 0 darf, also so wenig Inf ormationen als moglich haben darf. 
Im Hinblick auf den Speicherplatz kleinere Features haben 
unmittelbar kleinere Inf ormationssignaldatenbanken zur Fol- 
ge und resultieren auch in einer schnelleren Datenbanksu- 
che, um eine qualitative Aussage iiber ein zu testendes In- 

35 f ormationssignal oder sogar eine quantitative Aussage iiber 
ein solches Inf ormationssignal treffen zu kdnnen. 
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Eine weitere ebenfalls wichtige Anforderung an das aus dem 
Inf ormat ions signal zu extrahierende Merkmal besteht darin, 
dafi das Merkmal robust gegeniiber Veranderungen sein sollte. 
Solche Veranderungen bestehen in einem systemimmanenten 
5, Rauschen, einer Verzerrung z. B. aufgrund eines verlustbe- 
hafteten Codierverf ahrens . Andere Signalveranderungen sind 
beispielsweise Anderungen der Lautstarke am Beispiel eines 
Audiosignals sowie Verzerrungen aufgrund eines Abspielens 
eines Audiosignals iiber einen Lautsprecher und Wiederauf- 
10 zeichnen des Audiosignals iiber ein Mikrophon etc. 

Die Aufgabe der vorliegenden Erfindung besteht darin, ein 
flexibles und robustes Konzept zum Charakterisieren eines 
Inf ormat ions signals zu schaffen. 

15 

Diese Aufgabe wird durch eine Vorrichtung zum Charakteri- 
sieren eines Inf ormationssignals gemafi Anspruch 1, ein Ver- 
fahren zum Charakterisieren eines Inf ormationssignals nach 
Patentanspruch 19, eine Vorrichtung zum Aufbauen einer In- 

20 f ormationssignaldatenbank nach Patentanspruch 20, ein Ver- 
fahren zum Aufbauen einer Inf ormationssignaldatenbank nach 
Patentanspruch 21, eine Vorrichtung zum Identif izieren ei- 
nes Inf ormationssignals nach Patentanspruch 22, ein Verfah- 
ren zum Identif izieren eines Inf ormationssignals nach Pa- 

25 tentanspruch 23 oder ein Computer-Programm nach Patentan- 
spruch 24 gelost. 

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, 
daJ5 eine einerseits charakteristische Darstellung eines In- 

3 0 f ormationssignals und andererseits eine Darstellung des In- 
f ormationssignals mit begrenztem Speicherauf wand dadurch 
erreicht werden kann, dafi der Amplituden-Zeit-Verlauf des 
Inf ormationssignals dahingehend verarbeitet wird, daft loka- 
le Extremwerte bestimmt werden, und dafi Flacheninf ormatio- 

35 nen im Falle eines Inf ormationssignals mit eindimensionaler 
Amplitude oder Volumeninf ormationen im Falle eines Audio- 
signals mit zweidimensionaler Amplitude von Talern oder 
Bergen des inf ormationssignals ermittelt werden, wobei je- 
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dem Tal oder Berg des Inf ormationssignals ein lokaler Ex- 
tremwert sowie ein zeitlicher Abschnitt zugeordnet ist, wo- 
bei sich der zeitliche Abschnitt des Inf ormationssignals 
fur einen Berg oder fur ein Tal von dem Zeitpunkt des loka- 
5 len Extremwerts bis zu einem zeitlich benachbarten Wert des 
Inf ormationssignals erstreckt, der die gleiche Amplitude 
wie der lokale Extremwert aufweist. Dadurch werden Flachen- 
inf ormationen bzw. Volumeninf ormationen in zeitlich aufein- 
anderf olgender Darstellung erhalten, die fur das Informati- 
10 onssignal charakteristisch sind. 

Die vorliegende Erfindung ist dahingehend vorteilhaft, daS> 
die charakteristischen Eigenschaf ten eines Amplituden-Zeit- 
Verlaufs in Form von Flacheninf ormationen oder Volumenin- 

15 formationen integrale GroBen sind, die im Gegensatz bei- 
spielsweise zu Amplituden-Zeit-Tupel oder zu sonstigen eher 
an den akustischen Eigenschaf ten eines Audiosignals angena- 
herten Merkmalen, relativ invariante GroBen sind, die in 
ihrer tatsachlichen quantitativen Grofte oder zumindest in 

20 ihrer relative Grofie in Hinblick auf eine zeitliche Folge 
gegenuber Verzerrungen, Rauschen etc. eine hohe Robustheit 
aufweisen. 

Daruber hinaus ermoglicht das erf indungsgemaiie Konzept der 
25 Darstellung eines Inf ormationssignals durch integrale Gro- 
Ben, die vom Amplituden-Zeit-Verlauf des Inf ormationssig- 
nals abgeleitet sind, eine stark komprimierte Darstellung, 
die im Hinblick auf eine Inf ormationssignal-Identif ikation 
zum einen zu kleinen Datenbanken fiihrt und zum anderen zu 
3 0 kurzen Suchdauern zum Durchsuchen einer Datenbank unter 
Verwendung einer solchen Charakteristik eines zu testenden 
Signals . 

Ein weiterer Vorteil des erf indungsgemaJien Konzepts besteht 
35 darin, daft die Darstellung eines Inf ormationssignals mit 
einem Amplituden-Zeit-Verlauf anhand von integralen Fla- 
chen- oder Volumeninf ormationen in zeitlicher Folge beson- 
ders gut fur Inf ormationssignale geeignet sind, die sich 
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wiederholende Grundstrukturen haben, wie z. B. Audiosigna- 
le. So liefern Instrumente beispielsweise ein Signal, das 
fiir jedes Instrument charakteristisch ist, und das insbe- 
sondere eine fiir jedes Instrument charakteristische Folge 
5 von Flacheninformationen aufweist. Sich wiederholende Mus- 
ter treten auf, wenn ein Instrument auf einanderf olgende To- 
ne spielt. Dieses Muster findet sich unmittelbar in den 
auf einanderf olgenden Flacheninformationen wieder. Eine Mus- 
tererkennung der Folge von Flacheninformationen kann daher 

10 dazu verwendet werden, das Audiosignal zu segmentieren, urn 
diverse Nachverarbeitungen vornehmen zu konnen, wie z. B. 
eine Polyphonklangerkennung, eine Musikinstrumentenerken- 
nung oder eine Melodieerkennung . Dariiber hinaus zeichnen 
sich gesprochene Laute durch sich wiederholende Signalmus- 

15 ter aus. Daher ist das erf indungsgemafie Konzept auch zur 
Nachverarbeitung von Sprachsignalen geeignet, urn beispiels- 
weise eine Spracherkennung durchzuf iihren . 

Quasi-stationare Audiosignale als Beispiel fiir Informati- 
20 onssignale, die sich besonders gut fur das erf indungsgemafie 
Konzept eignen, wobei die Audiosignale beispielsweise durch 
Sprachlaute oder Musikinstrumenten-Laute dargestellt sind, 
zeichnen sich dadurch aus, daJ5 Replika des gleichen bzw. 
eines nur langsam veranderlichen Bodenprofils bzw. der 
25 gleichen oder einer nur langsam veranderlichen Audiosignal- 
forra n-fach aneinander gereiht werden, abhangig davon, wie 
lange der Sprachlaut gehalten bzw. wie lange der Ton an- 
gehalten wird. Replika der gleichen Signalform werden lokal 
festgestellt, indem gleiche oder nur geringfiigig abweichen- 
3 0 de Flacheninformationen der Folge von Flacheninformationen 
vorzugsweise des Original- und des Komplementarsignals mit- 
einander verglichen werden. 

Gleiche Wellenziige werden also dadurch identif iziert , da£ 
35 gleiche Flacheninhalte assoziiert werden. Der absolute In- 
halt, d. h. ein Flachenintegral, kann aber auch angeben, ob 
es sich um einen Vokal, Konsonant, ein bestimmtes Musikin- 
strument, einen hochf reguenten Ton etc. handelt. 
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Bevorzugte Ausf uhrungsbeispiele der vorliegenden Erfindung 
werden nachfolgend Bezug nehmend auf die beiliegenden 
Zeichnungen detailliert erlautert. Es zeigen: 

5 

Fig. 1 ein Blockschaltbild einer erf indungsgemafien Vor- 
richtung zum Charakterisieren eines Informations- 
signals; 

10 Fig. 2 ein Blockschaltbild einer erf indungsgemafien Vor- 
richtung zum Aufbauen einer Inf ormationssignal- 
Datenbank; 

Fig. 3 ein Blockschaltbild einer erf indungsgemaBen Vor- 
15 richtung zum Identif izieren eines Test-Inf orma- 

tionssignals unter Verwendung einer Inf ormations- 
signal-Datenbank; 

Fig. 4 einen Amplituden-Zeit-Verlauf eines beispielhaf- 
20 ten Informationssignals mit eingezeichneten Fla- 

cheninf ormationen fiir lokale Maxima und lokale 
Minima; 

Fig. 5 ein beispielhaf tes Signalf ormdiagramm fiir einen 
25 gesprochenen Vokal "o"; und 

Fig. 6 ein Amplituden-Zeit-Verlauf zur Darstellung der 
Normierung einer Flache bzw. eines Volumens auf 
eine Gesamtflache bzw. ein Ge samtvo lumen . 

30 

Bevor detaillierter auf die nachf olgenden Figuren eingegan- 
gen wird, wird zunachst zur besseren Anschaulichkeit der 
Erfindung das allgemeine Prinzip erlautert. In Anlehnung an 
die nachfolgende Erorterung wird das erf indungsgemafte Kon- 
35 zept fiir Audiosignale als Inf ormationssignale auch als "Au- 
dio-Watershed" bezeichnet. Dieses Konzept ist ein Konzept, 
mit dem Audiosignale in Intervalle unterteilbar sind. In 
der Geodasie ist das Konzept sehr anschaulich beschreibbar . 
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Berg- und Talbodenf ormationen werden von Regenwasser ange- 
fiillt. Das Wasser sammelt sich in Talsenken und umstromt 
Bergkuppen. Der maximale Fiillstand einer isolierten Region 
ist durch das zweidimensionale Bodenprofil und die Hohe der 
5 geringsten Durchlafistelle gegeben. Die auf genommene Wasser- 
menge kann einfach bestimmt werden, indem gemessen wird, 
welche Wassermenge der kontinuierlich stromenden Regenwas- 
serquelle bis zum Uberlauf entnommen wurde. 

10 Fur eindimensionale Inf ormationssignale , beispielsweise Au- 
diosignale, verteilen sich die herabregnenden Wassermengen 
iiber den gesamten Verlauf der Audiowellenziige . Zwischen 
zwei benachbarten lokalen Wellenmaximas bleibt das Wasser 
stehen und wird eingeschlossen . Sukzessive konnen weitere 

15 Teilbereiche geflutet werden, bis zum SchluJi auch das Amp- 
litudenmaximum der gesamten Signaldarstellung geflutet ist. 
Zu diesem Zweck miiJbte angenommen werden, dafi die Rander am 
Anfang und am Ende des Signals hoch sind, und zwar mindes- 
tens hoher als das globale Maximum des Signals. Dieses Kon- 

2 0 zept funktioniert jedoch auch ohne die Annahme solcher ho- 
her Rander. Dann wird das Maximum nicht geflutet, sondern 
das Wasser steigt nur bis zur Hohe des zweithochsten Maxi- 
mums an . 

25 Zur detaillierteren Darstellung des Signals wird es bevor- 
zugt, den Signalverlauf langs der t-Achse zu spiegeln, urn 
ein komplementares Inf ormationssignal zu erhalten, um das 
invertierte Profil entsprechend durch Flachenbestimmung der 
Taler zu vermessen. 

30 

Nachdem sich insbesondere bei den beschriebenen Informati- 
onssignalen gleiche Wellenziige periodisch quasi-stationar 
wiederholen, haben sie auch immer den gleichen "Wasserin- 
halt", so dafi> eine Segmentierung aufgrund des Wasserinhalts 
35 eines Wellenzugs, der sich aus mehreren Wasserinhalten der 
Taler, die in dem Wellenzug vorhanden sind, zusammensetzt , 
erfolgen kann. Gleiche Wellenziige werden also dadurch iden- 
tifiziert, daB gleiche Fla.cheninh.alte assoziiert werden. 
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Wie es noch anhand von Fig. 4 erlautert werden wird, kann 
die Inf ormationssignalcharakterisierung nicht nur anhand 
von Talern, die durch lokale Maxima definiert sind, durch- 
5 gefiihrt werden, sondern auch anhand von Bergen, deren Ba- 
sislinie durch ein lokales Minimum definiert ist, und deren 
Gipfel durch den Signalverlauf begrenzt sind. Diese Dar- 
stellung ist gleichwertig zur Invertierung des ursprungli- 
chen Inf ormationssignals und zur Betrachtung der Taler im 
10 invertierten Inf ormationssignal . 

Das erf indungsgemafte Konzept ist fur samtliche Informati- 
onssignale, die einen Amplituden-Zeit-Verlauf aufweisen, 
der lokale Extremwerte hat, anwendbar. Solche Inf ormations- 

15 signal konnen Audiosignale, Videosignale, Spannungssignale 
Oder Stromsignale, die irgendwie geartete Meftgroften identi- 
fizieren, etc. sein. Am Beispiel von Audiosignalen oder Vi- 
deosignalen sei darauf hingewiesen, daft der zeitliche Ver- 
lauf, also das Inf ormationssignal nicht unbedingt eine 

20 Spannungsamplitude oder eine Stromamplitude angeben muft, 
sondern daft das Inf ormationssignal auch eine Leistung oder 
einen Schalldruck als Amplitude haben kann. 

Daruber hinaus sei darauf hingewiesen, daB das Informati- 
25 onssignal eine eindimensionale Amplitude haben kann, wie z. 
B. bei einem Audiosignal, daft das Inf ormationssignal jedoch 
auch eine zweidimensionale Amplitude haben kann, so daft der 
Amplituden-Zeit-Verlauf des Inf ormationssignals tatsachlich 
dreidimensionale Berge und Taler umfaftt, wahrend diese Ber- 
30 ge und Taler im Falle eines Inf ormationssignals mit eindi- 
mensionaler Amplitude lediglich einen zweidimensionalen 
Verlauf haben, also durch Flacheninf ormationen dargestellt 
werden konnen. 

35 Daruber hinaus sei darauf hingewiesen, daft das Informati- 
onssignal selbstverstandlich nicht ein kontinuierliches 
Signal sein muft, sondern daft dasselbe auch ein zeitdiskre- 
tes Signal sein kann, bei dem ein gedachter kontinuierli- 
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cher Verlauf aus Anschaulichkeitsgriinden angenommen werden 
kann, der sich durch eine gerade Verbindung auf einanderf ol- 
gender zeitdiskreter Signalwerte oder durch Interpolation 
ergibt . 

5 

Nachfolgend wird anhand von Fig. 4 die vorliegende Erfin- 
dung dargestellt. Fig. 4 zeigt ein Inf ormationssignal 40 
mit einem Amplituden-Zeit-Verlauf . Bei dem in Fig. 4 ge- 
zeigten Inf ormationssignal handelt es sich um ein Informa- 

10 tionssignal mit eindimensionaler Amplitude. Das dargestell- 
te Inf ormationssignal ist ein typisches Audiosignal, das 
sich wiederholende Wellenziige hat, wobei ein Wellenzug im 
ersten Segment A dargestellt ist, wahrend der sich wieder- 
holende Wellenzug im zweiten Segment B dargestellt ist. Es 

15 sei darauf hingewiesen, da£ sich das Inf ormationssignal im 
zweiten Segment B selbstverstandlich von dem Informations- 
signal im ersten Segment A unterscheidet , jedoch nicht in 
seiner grundsatzlichen Topologie sondern lediglich bei dem 
in Fig. 4 gezeigten Ausfiihrungsbeispiel in der Amplitude zu 

20 bestimmten Zeitpunkten. 

Das Inf ormationssignal weist lokale Maxima 41a, 41b, 41c, 
41d, 41e und 41f auf. Jedem lokalen Maximum ist ein eigenes 
Tal zugeordnet. Dem Maximum 41a ist das mit AO bezeichnete 

25 Tal zugeordnet. Entsprechend ist dem Maximum 41b das Tal Al 
zugeordnet. Dariiber hinaus ist dem Maximum 41d das AB1 zu- 
geordnet. Dem Maximum 41c ist nun, da ein Teil des gesamten 
Tals bereits durch AB1 dem Maximum 41d zugeordnet ist, le- 
diglich der dariiberliegende Rest des Tals, der mit AB2 be- 

30 zeichnet ist, zugeordnet. Schlieftlich ist dem Maximum 41e 
das Tal Bl zugeordnet. Dem lokalen Maximum 41f in Fig. 4 
ist kein eigenes Tal zugeordnet. Dies liegt jedoch ledig- 
lich daran, daft der weitere Verlauf des Inf ormationssignals 
nicht mehr dargestellt ist. 

35 

Wie es aus Fig. 4 ersichtlich ist, ist jedes Tal durch ei- 
nen zeitlichen Abschnitt definiert, der in Fig. 4 am Bei- 
spiel des Tals Al, dem das lokale Maximum 41b zugeordnet 
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ist, mit 42 bezeichnet ist. Der zeitliche Abschnitt er- 
streckt sich insbesondere von dem Zeitpunkt 43 des Auftre- 
tens des lokalen Maximums 41b bis zu einem zeitlich benach- 
barten Wert des Inf ormationssignals, der die gleiche Ampli- 
5 tude wie der lokale Extremwert aufweist. Dieser zeitliche 
Wert ist in Fig. 4 mit 44 bezeichnet. Damit ergibt sich die 
Flache Al, die das dem lokalen Maximum 41b zugeordnete Tal 
reprasentiert . Entsprechend werden die anderen Taler AO, 
AB2, BO, Bl behandelt. Aus der Folge der Taler AO, Al, AB1, 
10 B0, Bl ergibt sich bereits eine Charakterisierung des In- 
formations signals , die zur Identif ikation verwendet werden 
kann . 

Erf indungsgemafl wird es jedoch bevorzugt, nicht nur die 
Flacheninf ormationen von Talern des Inf ormationssignals 
sondern auch die Flacheninf ormationen von Talern des inver- 
tierten Inf ormationssignals zu berechnen. Eine Inversion 
des Inf ormationssignals kann erreicht werden, wenn Fig. 4 
einfach umgedreht wird. Dies ist durch die umgekehrt ge- 
schriebenen Flachenidentif ikatoren AO*, Al ' , A2 ' , A21 1 , 
A210', B0', Bl', B2', B21 • , B210' dargestellt . 

Alternativ, wenn Fig. 4 nicht "umgedreht wird", so ergeben 
sich die "Berge", die jedem lokalen Minimum zugeordnet 
25 sind, f olgendermaBen . Eine Untersuchung des Informations- 
signals liefert lokale Minima 45a, 45b, 45c, 45e, 45f. Der 
erste Berg AO' ist durch das lokale Minimum 45a sowie durch 
den zeitlich benachbarten Wert des Inf ormationssignals be- 
stimmt, der denselben Wert wie das lokale Minimum hat, also 
3 0 einen Wert 4 6 definiert. Zwischen dem Wert 4 6 und dem loka- 
len Minimum 45a ergibt sich der zeitliche Abschnitt 47, der 
den Berg AO 1 identif iziert . Zur Charakterisierung des In- 
f ormationssignals wird nun die Flache des Berges AO' gemaJi 
der in Fig. 4 gezeigten Darstellung als Flacheninf ormatio- 
35 nen berechnet . Analog hierzu wird mit dem Berg Al 1 , A2 ' 
etc. vorgegangen. Aus Fig. 4 ist ferner ein Fall ersicht- 
lich, bei dem sich der Berg A210', dem das lokale Minimum 
45c zugeordnet ist, iiber einem Berg A21 1 befindet, dem das 
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lokale Minimum 45a zugeordnet ist und insbesondere iiber den 
Bergen Al ' und A2 1 befindet, denen das lokale Minimum 45b 
zugeordnet ist. Aus dem in Fig. 4 gezeigten Beispiel ist 
somit ersichtlich, daJ3 einem lokalen Minimum auch zwei Fla- 
5 cheninf ormationen zugeordnet sein konnen, derart, daJ5 dem 
lokalen Minimum 45b sowohl die Flacheninf ormation des Bergs 
Al ' als auch die Flacheninf ormation des Bergs A2 ' zugeord- 
net ist. Entsprechendes gilt fur das lokale Minimum 45a, 
dem sowohl die Flacheninformationen AO ' als auch die Fla- 
10 cheninf ormationen A21' zugeordnet sind. 

Bei der Betrachtung der Flacheninformationen A210', A21', 
A2 ' und Al ' wird ersichtlich, daft hier dieselbe Vorgehens- 
weise verwendet worden ist, wie sie anhand der ubereinander 
15 liegenden Taler ABl und AB2 erlautert worden ist. 

Nach einer Bearbeitung des Inf ormationssignals dahingehend, 
daft die Flacheninformationen samtlicher Berge und Taler in 
Zuordnung zu den entsprechenden lokalen Maxima und Minima 

20 bzw. in Zuordnungen zu einem bestimmten Zeitpunkt sind, der 
ein ausgewahlter Zeitpunkt aus dem zeitlichen Abschnitt 
ist, wird eine Folge von Flacheninformationen bzw. Volumen- 
inf ormationen erhalten, wobei diese Folge von Zeit- 
Flachenwerten bzw. Zeit-Volumenwerten fiir das Inf ormations- 

25 signal charakteristisch ist. 

Nachfolgend wird Bezug nehmend auf Fig. 1 eine bevorzugte 
Vorrichtung zum Charakterisieren eines Inf ormationssignals 
dargestellt. Die Vorrichtung zum Charakterisieren eines In- 

3 0 f ormationssignals, das einen Amplituden-Zeit-Verlauf mit 
lokalen Extremwerten aufweist, umfaftt eine Einrichtung 10 
zum Bestimmen von lokalen Extremwerten des Inf ormationssig- 
nals, wobei ein lokaler Extremwert einen Zeitpunkt und ei- 
nen Amplitudenwert uraf afit . Der Einrichtung 10 zum Bestimmen 

35 von lokalen Extremwerten ist eine Einrichtung 11 zum Ermit- 
teln von Flachen- bzw. Volumeninf ormationen fiir Berge und 
Taler des Inf ormationssignals nachgeschaltet . Die Einrich- 
tung zum Ermitteln von Flacheninformationen oder Volumenin- 
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formationen ist wirksam, urn die Flache eines Tals oder 
Bergs zu berechnen, wobei ein Tal oder Berg durch einen 
zeitlichen Abschnitt des Inf ormationssignals definiert ist, 
wobei sich der Abschnitt des Inf ormationssignals von dem 
5 Zeitpunkt des lokalen Extremwerts bis zu einem zeitlich be- 
nachbarten Wert des Inf ormationssignals, der die gleiche 
Amplitude wie der lokale Extremwert aufweist, erstreckt. 
Die Flacheninformationen von mehreren Bergen oder Talern 
sind fur das Inf ormationssignal charakteristisch . 

10 

Vorzugsweise wird die Einrichtung 11 eine Folge von Fla- 
cheninformationen-Zeit-Werten erzeugen und einer Einrich- 
tung 12 zum Nachverarbeiten zufiihren, die ausgebildet ist, 
urn einen nachverarbeiteten Merkmalsvektor auszugeben oder 
15 eine Spracherkennung, eine Musikinstrumentenerkennung, eine 
Melodieerkennung, eine Polyphonklangerkennung oder irgend 
eine sonstige Erkennung von Inf ormationen durchzuf iihren, 
die in dem Inf ormationssignal, das in die Einrichtung 10 
eingespeist wird, enthalten sind. 

20 

Zur Bestimmung von lokalen Extremwerten durch die Einrich- 
tung 10 konnen beliebige bekannte Konzepte hierfur verwen- 
det werden, wie z. B. ein ublicher Minima-Maxima- 
Suchalgorithmus, der einen Abtastwert des Inf ormationssig- 

25 nals mit dem vorherigen Abtastwert des Inf ormationssignals 
vergleicht und dann ein lokales Maximum erkennt, wenn der 
zeitlich spatere Abtastwert kleiner als der zeitlich friihe- 
re Abtastwert ist, und wenn vorher ein lokales Minimum war. 
Der Algorithmus erkennt ferner ein lokales Minimum, wenn 

3 0 der zeitlich fruhere Abtastwert grofler als der zeitlich 
spatere Abtastwert ist, und wenn vorher ein lokales Maximum 
war. Alternativ kann der Maxima/Minima-Sucher auch ausge- 
bildet sein, urn mehrere auf einanderf olgende Abtastwerte 
entsprechend auszuwerten. Dm nicht durch ein dem Informati- 

35 onssignal iiberlagertes Rauschen beeintrachtigt zu werden, 
kann die Einrichtung 10 ferner ausgebildet sein, urn vor der 
Maxima/Minima-Suche eine Tiefpaftf ilterung des Informations- 
signals durchzufiihren, urn ein glatteres Inf ormationssignal 
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zu erhalten. Selbstverstandlich sind beliebige andere Mog- 
lichkeiten denkbar, wie z. B. das Durchfiihren eines Poly- 
nomfits an das Inf ormationssignal und das analytische 
Bestimmen von Extremwerten unter Verwendung der Polynomfit- 
5 funktionen. Alternativ konnte auch das direkt vorliegende 
ungefilterte Inf ormationssignal verwendet werden, urn samt- 
liche Maxima und Minima zu bestimmen, und urn dann nachtrag- 
lich die Berge oder Taler mit einem kleineren Flacheinhalt 
als einem vorgegebenen Schwellwert herauszuf iltern bzw. in 
10 der weiteren Inf ormationssignal-Charakterisierung nicht 
mehr zu verwenden . 

Die Einrichtung 11 zum Ermitteln von Flachen- bzw. Volumen- 
inf ormationen fur Berge und Taler wird typischerweise als 
numerischer Integrator ausgebildet sein, urn die Flache zwi- 
schen dem Inf ormationssignal und der oberen Talbegrenzung 
bzw- der unteren Bergbegrenzung zu berechnen. Im Falle von 
iibereinanderliegenden Bergen oder Talern ist die Einrich- 
tung 11 zum Ermitteln von Flachen- bzw. Volumeninf ormatio- 
nen ausgebildet, um zu berucksichtigen, dafi unter dem "Tal" 
bereits ein anderes "Tal" liegt. Als Basislinie zur Integ- 
ration wird dann die obere Begrenzungslinie des darunter- 
liegenden Tals, also beispielsweise die Linie 48 von Fig. 4 
verwendet. Die Flache AB2 berechnet sich also unter Verwen- 
dung der seitlichen Begrenzung der Flache AB2, die durch 
das Inf ormationssignal gegeben ist und unter Verwendung der 
Basislinie 48 und der oberen Begrenzung der Flache AB2, die 
in Fig. 4 mit 4 9 dargestellt ist und gewissermaften den 
"Wasserstand" definiert, der durch das lokale Maximum 41c 
festgelegt ist. 

Im nachf olgenden wird auf unterschiedliche Ausgestaltungen 
der Einrichtung 12 zum Nachverarbeiten der Folge von Fla- 
cheninf ormationen bzw. Volumeninf ormationen eingegangen. 
35 Wie es bereits ausgefiihrt worden ist, eignet sich das er- 
f indungsgemafte Konzept insbesondere zur Segmentierung von 
Inf ormationssignalen auf der Basis der berechneten Volumen- 
inf ormationen . In Fig. 4 sind zwei Replika A und B der Sig- 
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nalform dargestellt. Es ergeben sich Kombinationspaare 
gleicher oder geringfugig abweichender Volumina. Im nicht- 
invertierten Signal sind dies die Kombinationspaare (AO, 
BO) , (Al, Bl) . 

5 

Im invertierten Signal, also hinsichtlich der Berge, erge- 
ben sich f olgende Kombinationspaare (AO 1 , BO 1 ) , (Al 1 , Bl ' ) , 
(A2', B2'), (B21', A21')/ (A210', B210')- 

10 Die prozentuale Schwankung AF/F ist fur grofte eingeschlos- 
sene Flachen geringer, so dafi besonders bei Rauschen die 
Flacheninformationsvergleiche grofier Flachen eine verlaftli- 
chere Schatzung auf Identitat sind. Ein Beispiel hierfiir 
ist das Kombinationspaar (A210', B210*). Die repetitiven 

15 Volumina/Flachensequenzen (A210'_n, AB2_n, B210'_n) weisen 
auf das Vorliegen einer bestimmten Signalform hin . Der ge- 
samte Inf ormationssignalverlauf wird somit auf der Basis 
der Folge von Flacheninf ormationen in m Sequenzen von Fla- 
chen- bzw. Voluminaintervallen unterteilt, woraufhin Fla- 

2 0 chen- bzw. Voluminasequenzen zu Abschnitten der gleichen 
Informationssignalform zusammengef aJit werden. Eine Flachen- 
bzw. Voluminahullkurve wird bestimmt, indem der Aufbau der 
Wellensignalform sich langsam vollzieht, wobei die Flachen 
bzw. Volumina gleicher repetitiver Sequenzen in einer An- 

25 stiegsphase ansteigen, dann in einer Sustainphase annahernd 
gleich bleiben und dann in einer Abklingphase langsam ab- 
nehmen. An dieser Stelle sei darauf hingewiesen, daft typi- 
sche Tone von Musikinstrumenten eine Anstiegsphase, eine 
Sustainphase und eine Abklingphase haben. So ware bei- 

30 spielsweise bei einem Klavier, bei dem eine Saite durch den 
Aufschlag eines Hammerchens angeregt wird, die Anstiegspha- 
se relativ kurz . Die Sustainphase ware ebenfalls relativ 
kurz, wahrend die Abklingphase relativ lang dauern wiirde . 

35 Eine Intervallgrenze ergibt sich dann, wenn sich Flachen 
bzw. Volumina abrupt andern. 
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Erf indungsgemaJi kann auf der Basis der Folge von Flachen- 
bzw. Voluminainf ormationen auch eine Frequenzbestimmung 
durchgefiihrt werden. Die Frequenz des Wiederholungsmusters 
wird bestimmt, indem die Abstande der lokalen Maxima bzw. 
lokalen Minima auf einanderf olgender gleicher oder nur ge- 
ringfiigig unterschiedlicher Flachen bzw. Volumina in der 
Form beispielsweise ((AO, BO), Al, Bl) ) gebildet werden, 
und wenn im invertierten Signal die Abstande ((AO 1 , BO 1 )/ 
(Al', Bl'), <A2', B2'), (A21', B21 ' ) , (A210', B210 ' ) gebil- 
det werden . 

Das gewissermaBen entstehende Relief auf einanderf olgender 
Bergkuppen und Talsohlen wird durch die Bestimmung des Re- 
pititionsmusters der Form (A210', AB2, B210') ermittelt . 
Das Feinprofil eines Bergkamms oder einer Talsohle wird 
durch die Angabe der strukturierenden Elemente AO, Al und 
AO', Al', A2", A21' bestimmt. 

Erf indungsgemaii ist die Einrichtung 12 zum Nachverarbeiten 
ferner ausgebildet, um jeder Flacheninf ormation oder Volu- 
meninf ormation einen Vektor zuzuweisen, der vorzugsweise 
den Zahlenwert des Flacheninhalts bzw. Volumeninhalts und 
den Zeitwert des Auftretens umfafit. Als Zeitwert des Auf- 
tretens kann irgend ein Zeitwert des zeitlichen Abschnitts 
genommen werden. Es wird bevorzugt, einem Flacheninhalt den 
Zeitpunkt des Auftretens des lokalen Extremwerts zuzuord- 
nen, der dem Flacheninhalt zugeordnet ist. Bedingt ein lo- 
kaler Extremwert, wie z. B. der lokale Extremwert 45b von 
Fig. 4 zwei in Fig. 4 gezeigte "Berge" Al ' , A2 1 , so wird 
den Flacheninf ormationen Al ' , A2 * derselbe Zeitwert zuge- 
ordnet, namlich der Zeitwert des Auftretens des lokalen Mi- 
nimums 4 5b. 

Damit entsteht ein Zahlenfeld von n Vektoren langs der 
Zeitachse. Solche Sequenzen von Vektoren konnen mit DNA- 
Sequencing-Methoden mit bestehenden Volumenvektoren, die in 
einer Musikdatenbank gespeichert sind, verglichen werden, 
um liber Identif ikationen, die den einzelnen Vektoren in der 
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Musikdatenbank zugeordnet sind, beispielsweise eine Infor- 
mationssignal-Identif ikation durchzuf iihren . 

Werden die Informationssignale, wie z. B. Audiosignale un- 
5 terschiedlicher Aufnahmen, normiert, so konnen Flachen- 
bzw. Voluminasequenzen direkt miteinander verglichen wer- 
den. Mit einer Frequenzbestimmung konnen Flachen bzw. Volu- 
mina, die die gleiche Audiosignalf orm haben, aber durch die 
f requenzabhangige Zeitdehnung dennoch unterschiedliche Fla- 
10 chen bzw. Volumina aufweisen, miteinander in Bezug gesetzt 
werden . 

Aus den Volumina bzw. Flachen und der Lage der Maxima bzw. 
Minima konnen erf indungsgemafi weitere Flachenform- 

15 beschreibende Parameter, wie z. B. die longitudinale Aus- 
dehnung, durch die Einrichtung 12 zum Nachverarbeiten von 
Fig. 1 bestimmt werden. Solche weiteren Parameter erlauben 
eine Aussage, ob es sich beispielsweise um Sprachlaute oder 
von Musikinstrumenten evozierte Signale handelt. In dem In- 

20 f ormationssignal selbst konnen vorzugsweise durch die Ein- 
richtung 12 zum Nachverarbeiten lediglich relative Flachen 
bzw. Volumina verwendet werden, indem durch die Einrichtung 
12 zum Nachverarbeiten das Verhaltnis auf einanderf olgender 
Flachen bzw. Volumina gebildet wird. 

25 

Allgemein gesagt haben Sprachlaute, Polyphonklange oder von 
Musikinstrumenten evozierte Monophonklange voneinander ab- 
weichende Audiosignalf ormen und sind daher anhand der Fla- 
chen- bzw. Voluminasequenzen unterscheidbar . Der frequenz- 

30 abhangige Anteil einer gleichen Audiosignalf orm wird eben- 
falls durch eine Anderung der Flachen bzw. Volumina be- 
stimmt. 1st einem Sprachlaut (Vokal) eine insgesamte Flache 
eindeutig zuordenbar, so konnen Vokalabschnitte aus dem In- 
f ormationssignal herausgelesen werden. Ebenfalls konnen 

35 Konsonanten und Ubergangsabschnitte durch Angabe der Fla- 
chen- bzw. Voluminasequenzen unter Verwendung der Einrich- 
tung 12 zum Nachverarbeiten bestimmt werden. Dasselbe 
trifft fur Polyphonklange wie auch fur Melodief olgen zu . 
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Fig. 2 zeigt eine Vorrichtung gemafl einem weiteren Aspekt 
der vorliegenden Erfindung, die zum Aufbau einer Informati- 
onssignal-Datenbank dient . In eine Vorrichtung 20 zum Cha- 
5 rakterisieren, die prinzipiell so aufgebaut sein kann, wie 
es in Fig. 1 dargestellt ist, werden auf einanderf olgend 
mehrere Inf orraationssignale unter der Steuerung einer Steu- 
ereinrichtung 21 eingespeist, una fur jedes der mehreren In- 
f ormationssignale einen Merkmalsvektor zu bestimmen, der 

10 von den Flachen- bzw. Voluminainf ormationen abgeleitet ist. 
Damit kann eine Inf ormationssignaldatenbank 22 aufgebaut 
werden, deren Kernstuck ein Speicher 23 ist, in dem die 
Merkmalsvektoren (MM1, MM2, MM3) der in die Einrichtung 20 
eingespeisten Inf ormationssignale jeweils in Zuordnung zu 

15 bestimmten Identif ikatoren (ID1, ID2, ID3) gespeichert 
sind. Die Identif ikatoren IDl, ID2, ID2 erlauben eine Iden- 
tifikation der Inf ormationssignale, deren Merkmalsvektoren 
MM1, MM2, MM3 in der Inf ormationssignaldatenbank und insbe- 
sondere in dem Speicher 23 der Inf ormationssignaldatenbank 

20 abgelegt sind. Eine Inf ormationssignaldatenbank ist urn so 
universeller, je mehr einzelne Inf ormationssignale durch 
die Vorrichtung 2 0 zum Charakterisieren verarbeitet worden 
sind und in entsprechender Form, also mittels eines diesel- 
ben jeweils charakterisierenden Merkmalsvektors, im Spei- 

25 cher vorhanden sind. 

Fig. 3 zeigt eine erf indungsgemafte Vorrichtung zum Identi- 
fizieren eines Test-Inf ormationssignals anhand einer Infor- 
mationssignaldatenbank 22, die prinzipiell genauso aufge- 

30 baut sein kann, wie die anhand von Fig. 2 beschriebene In- 
f ormationssignaldatenbank. Hierzu wird in die Vorrichtung 
20 zum Charakterisieren ein Test-Inf ormationssignal einge- 
speist, das zu identif izieren ist, bzw. von dem eine Iden- 
tifikation in Hinblick auf bestimmte Merkmale desselben in 

35 qualitativer und/oder quantitativer Hinsicht erlangt werden 
soil. Durch die Einrichtung 20 zum Charakterisieren wird 
aus dem Test-Inf ormationssignal ein Test-Merkmalsvektor er- 
mittelt, der das Test-Inf ormationssignal charakterisiert . 
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Mit diesera Test-Merkmalsvektor wird dann eine Suche in der 
Informationssignal-Datenbank unter den im Speicher 23 ge- 
speicherten Merkmalsvektoren MM1 , MM2, MM3 durchgef iihrt, um 
am Ausgang der Informationssignal-Datenbank eine Aussage 
5 liber das Test-Inf ormationssignal zu erhalten. 

Die Aussage iiber das Test-Informationssignal, die durch die 
in Fig. 3 gezeigte Vorrichtung zum Identif izieren des Test- 
Inf ormationssignals geliefert wird, kann beispielsweise ei- 

10 ne tatsachliche Bestimmung des Autors oder Urhebers des In- 
f ormationssignals sein. Eine Aussage kann jedoch auch eine 
quantitative Aussage sein, dahingehend, daJ5 das Test- 
Informationssignal beispielsweise eine bestimmte Anzahl von 
Vokalen oder Konsonanten enthalt . In diesem Fall waren die 

15 Merkmalsvektoren MMl, MM2, MM3, die in der Informationssig- 
nal-Datenbank gespeichert sind, Merkmalsvektoren einzelner 
Vokale oder Konsonanten. Nachdem der Merkmalsvektor , der 
durch die Vorrichtung zum Charakterisieren 20 erzeugt wer- 
den kann, ein quantitativer Merkmalsvektor ist, und nachdem 

2 0 in diesem Fall die in der Informationssignal-Datenbank ab- 

gespeicherten Merkmalsvektoren ebenfalls quantitative Merk- 
male sind, konnen auch quantitative Aussagen uber das Test- 
Informationssignal getroffen werden, namlich dahingehend, 
dafl es einen bestimmten Ahnlichkeitsgrad zu einem Informa- 
25 tionssignal hat, das anhand seines Merkmalsvektors in der 
Informationssignal-Datenbank vorliegt . 

Fig. 5 zeigt ein beispielhaf tes Signalf ormdiagramm, das 
sich ergibt, wenn der Vokal "o" bei einer Frequenz von etwa 
30 100 Hz durch den Erfinder gesprochen wird. Entlang der Ko- 
ordinate ist in Fig. 5 die Amplitude normiert auf Werte 
zwischen - 1,0 und 1,0 aufgetragen. Entlang der Abszisse 
ist in Fig. 5 die Zeit in Sekunden aufgetragen. Es zeigt 
sich, daS der Vokal "o" ein stark repetitives Signalmuster 

3 5 hat, das sehr ahnliche Fla.ch.en- bzw. Volumeninf ormationen- 

Sequenzen aufweist. Im einzelnen ist zu sehen, dafi sich die 
Sequenz von Flacheninf ormationen VI, V2 periodisch wieder- 
holt . 
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Durch Feststellen dieser Sequenz VI, V2 in der zeitlichen 
Folge von Volumeninf ormationen wird erf indungsgemaS eine 
Segmentierung durchgefuhrt , beispielsweise bei dem lokalen 
5 Maximum, das die mit V2 bezeichneten Flacheninf ormationen 
bestimmt und in Fig. 5 mit 50 bezeichnet ist. 

Alternativ konnte eine Segmentierung auch bei einem lokalen 
Minimum, wie z. B. dem Maximum 50 lokalbenachbarten Minimum 
10 oder dem wieder nach links benachbarten lokalen Maximum 
vorgenommen werden, das das Tal identif iziert , das mit VI 
bezeichnet ist . 

Anhand der Fig. 5 ist ferner zu sehen, da£ die Flachenin- 
15 f ormationen VI das gesamte linke Tal der Signalform umfas- 
sen. Das durch VI identif izierte Tal umfaSt somit die Fla- 
cheninf ormationen der beiden Taler unterhalb der gestri- 
chelten Linie 51 sowie die Flacheninf ormationen zwischen 
der Linie 51 und der oberen Begrenzungs linie, die durch ein 
20 lokales Maximum 52 definiert ist. Aus Fig. 5 ist ersicht- 
lich, da£ entweder Sequenzen von einzelnen Flacheninf orma- 
tionen von Talern oder Bergen verwendet werden konnen, oder 
dafi zur Segmentierung auf der Basis von auftretenden Fla- 
cheninf ormationssequenzen auch "kombinierte" Taler/Berge 
25 genommen werden konnen, wie z. B. das durch VI identif i- 
zierte Tal . 

Bei einem weiteren bevorzugten Ausfuhrungsbeispiel der vor- 
liegenden Erfindung wird neben den Flachen/Volumeninf orma- 

30 tionen auch die Hoheninf ormation berucksichtigt . Dieses 
Konzept hat wiederum sein Analogon in der Geodasie, wenn 
namlich nicht nur die Wassermenge in einem Tal berucksich- 
tigt wird, sondern die potentielle Energie dieser Wasser- 
mengen in dem Tal. Damit ist eine Hyperf einstruktur des 

35 Signals angebbar, indem zusatzlich der Energieterm der po- 
tentiellen Energie angegeben wird. Die potentielle Energie 
ist gleich dem Produkt aus Dichte, Volumen, Beschleunigung 
und Hohe . Ferner kann eine gewissermaSen kompressionslose 
Flussigkeit angenommen werden. Daruber hinaus werden die 



WO 2004/010327 



21 



PCT/EP2003/001916 



Dichte und die Beschleunigung konstant angenommen und so 
eingestellt, daS sich. die Lageenergie eines "Wasserspei- 
chers" aus dem integralen Produkt aus eingeschlossenen vo- 
lumen und Hohe errechnet. Die Energie des in dem mit VI be- 
5 zeichneten Tal in Fig. 5 kann durch Zerlegen des Tals in 
kleine Rechtecke berechnet werden, wobei die Flache jedes 
Rechtecks vor der Auf summation mit der Hohe dieses Recht- 
ecks, also der Amplitude, die diesem Rechteck zugeordnet 
ist, multipliziert wird. 

10 

Damit werden hoher gelegene Volumina starker gewichtet, 
wahrend Rauschen um die Nullinie weniger stark gewichtet 
wird. Die Gewichtung hoher gelegenen Flacheninf ormationen 
durch Miteinbeziehung der entsprechenden Hohe entspricht 
15 dem ublichen Wesen von Musiksignalen, bei denen laute Sig- 
nalanteile die Tendenz besitzen, hoher inf ormationstragend 
zu sein als leise Signalanteile . 

Ein Signal mit starkerer Amplitude tragt somit mehr Infor- 
20 mationen als ein Signal mit schwacherer Amplitude. Diesem 
Aspekt wird durch die Gewichtung der Folge von Flachenin- 
formationen mit entsprechenden Hoheninf ormationen, um ge- 
wissermaSen die potentielle Energie eines in einem Tal be- 
findlichen Wassers zu erhalten, Genuge getan. 

25 

Im nachf olgenden wird ferner auf ein bevorzugtes Ausfuh- 
rungsbeispiel beispielsweise zum Berechnen der Flache Al 
von Fig. 4 eingegangen. Vorzugsweise wird die Flache Al 
derart berechnet, daS zumindest die Flache des Rechtecks 

3 0 berechnet wird, das sich durch die obere Begrenzungslinie 
42, eine untere Begrenzungslinie, die durch das lokale Mi- 
nimum 45b geht, sowie die beiden in Fig. 4 eingezeichneten 
gestrichelten Seitenlinien ergibt . Darauf hin wird eine nor- 
male Integration des Signals vom lokalen Maximum 41b bis 

35 zum Punkt 44 durchgefuhrt, wobei als Nullinie der Funktion 
die Linie genommen wird, die durch das lokale Minimum 45b 
verlauf t . Die dadurch erhaltene Flache wird dann von der 
ursprunglich berechneten Rechtecks flache subtrahiert, um 



WO 2004/010327 



22 



PCT/EP2003/001916 



schlieElich die Flache Al des Tals zu erhalten, das durch 
das lokale Maximum 41b definiert ist. 

Es sei darauf hingewiesen, da£ zur Berechnung der Flachen 
5 der Berge nicht eine erneute Integration iiber das Informa- 
tions signal durchgefiihrt werden muB, sondern dafi eine ein- 
malige Integration ausreichend ist, urn dann anhand des Kur- 
venintegrals und verschiedener Rechtecke samtliche Flachen- 
informationen der Taler bzw. Berge zusammenzustellen. 

10 

Wie es bereits ausgefiihrt worden ist, ist der Vokal "o" in 
Fig. 5 etwa bei 100 Hz gesprochen worden. Wiirde der Vokal 
bei einer hoheren Frequenz gesprochen werden, so wiirde sich 
ein zwar ahnliches Zeitdiagramm ergeben, das jedoch hin- 
15 sichtlich der Zeitachse gestaucht ist. Wiirde der Vokal da- 
gegen mit einer niedrigeren Frequenz aus 100 Hz gesprochen 
werden, so wiirde sich ein prinzipiell zu Figur 5 ahnliches 
Zeitdiagramm ergeben, das jedoch urn einen entsprechenden 
Faktor, der von der Frequenzdif f erenz abhangt, gedehnt ist. 

20 

Zur Frequenz -Amplitudennormierung wird daher erf indungsge- 
maS ein bei einer Normf requenz , wie z. B. 100 Hz, gespro- 
chener Vokal in der Inf ormationssignaldatenbank 22 von Fig. 
3 anhand seines Merkmalsvektors und seiner Identif ikation 

25 abgelegt. Ein Testsignal, von dem nicht bekannt ist, bei 
welcher Frequenz es gesprochen worden ist, wird dann inner- 
halb der Inf ormationssignaldatenbank hinsichtlich seines 
Test -Merkmalsvektors (Fig. 3) einem Sweep iiber der Frequenz 
unterzogen. Dies bedeutet, dafi der Signalverlauf des Test- 

30 signals, der Signalverlauf des in der Inf ormationssignalda- 
tenbank abgespeicherten Signals oder beide Signale oder 
Merkmalsvektoren entsprechend gestaucht bzw. gedehnt wer- 
den, urn bei jedem Stauchungsf aktor z. B. anhand der Methode 
der kleinsten Fehlerquadrate eine Ubereinstimmung festzu- 

35 stellen. Damit kann ermittelt werden, ob iiberhaupt zu ir- 
gendeinem Zeitpunkt des Frequenz -Sweeps eine ausreichend 
gute Ubereinstimmung stattgef unden hat. Wird dies verneint, 
so umfaSt das Test- Inf ormat ions signal beispielsweise keinen 
gesprochenen Vokal "o" . Wird dagegen bei einer bestimmten 
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Einstellung im Frequenz- Sweep eine ausreichend gute Uber- 
einstimmung f estgestellt , so kann davon ausgegangen werden, 
dafi im Test-Inf ormat ions signal ein gesprochener Vokal "o" 
vorliegt, und daS dieser gesprochene Vokal bei einer be- 
5 stimmten Frequenz gesprochen worden ist. 

Es sei darauf hingewiesen, dafi sich durch die Deh- 
nung/Stauchung des Merkmalsvektors oder, wenn die Deh- 
nung/Stauchung vor der Extraktion des Merkmalsvektors 

10 durchgefuhrt wird, zwar die absoluten Flacheninf ormat ionen 
verandern. Gleich bleiben jedoch die Relationen der Fla- 
chen/Volumeninformationen zueinander, so daS eine Deh- 
nung/Stauchung an der Zeitach.se keine Auswirkung auf Se- 
quenzen von Flacheninf ormationen dahingehend hat, dafi diese 

15 nicht mehr identif iziert werden konnten. 

Eine analoge Vorgehensweise wird im Hinblick auf eine Amp- 
litudennormierung erfindungsgema.fi eingesetzt. Wird der ge- 
sprochene Vokal "o" von Fig. 5 mit einer bestimmten mittle- 
20 ren Lautstarke in der Inf ormationssignaldatenbank 22 von 
Fig. 3 abgespeichert, so kann eine Dehnung/Stauchung (Ver- 
starkung/Dampfung) entlang der Amplituden-Achse mit darauf- 
folgender Fehlerquadratmethode durchgefuhrt werden, um ers- 
tens f estzustellen, ob der Vokal uberhaupt in einem Test- 

2 5 Inf ormat ionssignal vorhanden ist, und um zweitens f estzu- 

stellen, mit welcher Lautstarke der Vokal im Test- 
Inf ormationssignal auf getreten ist . Bestimmte Suchstrate- 
gien zur einzelnen oder kombinierten Veranderung, d.h. Deh- 
nung/Stauchung entlang der Zeitachse und der Amplitudenach- 

3 0 se, wird auf den Stand der Technik im Hinblick auf DNA- 

Sequencing-Konzepte oder auf Methoden der kleinsten Fehler- 
guadrate verwiesen, um beispielsweise die minimale Metrik 
bzw. den nachsten Nachbar ("Next Neighbor") zu bestimmen. 

3 5 Alternativ kann zur Frequenz /Amplituden-Kalibrierung eine 
Inf ormationssignaldatenbank 22 geschaffen werden, bei der 
die einzelnen Merkmalsvektoren mit bestimmten Lautstar- 
ke/Frequenz-Einstellungen eines Mefisystems auf gezeichnet 
worden sind. Sofern ein Zugriff hierauf besteht, konnen 
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dieselben Einstellungen z. B. hinsichtlich der Lautstarke, 
von dem Test -Inf ormationssignal gefordert werden. Hierauf 
kann eine Kennlinie abgeleitet werden, urn Fla- 
chen/Volumeninformationen eines beispielsweise bei 140 Hz 
5 gesprochenen Vokals "o" in Flachen/Volumeninformationen bei 
der vorbestimmten Auf nahmeeinstel lung, wie z. B. einer Fre- 
quenz von 100 Hz, umzurechnen bzw. abzubilden. 

Schliefilich wird darauf hingewiesen, daS stark signifikante 

10 Merkmale eines Audiosignals als Beispiel fur ein Informati- 
onssignal in grofien Volumen/ Flacheninf ormationen liegen. 
Solche groSen Volumen/Flacheninf ormationen ergeben sich 
durch Summation der Flacheninf ormationen AB1 , AB2, BO von 
Fig. 4. Das gesamte Tal, das durch AB2 , AB1 , BO definiert 

15 ist, erha.lt seine Hohenbegrenzung 49 aufgrund des lokalen 
Maximums 41c. Durch Auf addition der Taler, die durch lokale 
Maxima mit kleinerer Amplitude definiert sind, wie z. B. 
des lokalen Maximums 4 Id, wird die gesamte Flache des durch 
die Begrenzungslinie 49 nach oben begrenzten Tals erhalten. 

20 Entsprechend wird fur die Taler des invertierten Signals, 
d.h. die Berge des nicht- invertierten Signals vorgegangen. 
Der Berg, der insgesamt das erste Segment A identif iziert , 
ergibt sich aus den Flacheninf ormationen A210 1 , AO', A21', 
Al ' , A2 ' . Durch Ermitteln der Flacheninf ormationen eines 

25 gesamten Bergs oder eines gesamten Tals kann erf indungsge- 
ma.fi eine Segmentierung mit verla.filicb.en Ergebnissen durch- 
gefiihrt werden, da solche groSen Flacheninf ormationen fur 
Berge oder Taler fur die Grobstruktur , d.h. fur die repeti- 
tive Struktur des Inf ormationssignal s , charakteristisch 

3 0 sind. 

Als weiteres Merkmal oder Feature wird es bevorzugt, die 
Flachen/Volumeninformationen einer einzelnen Sequenz VI, V2 
von Fig. 5 zu addieren, um eine Gesamtflache der Sequenz zu 
35 erhalten, mit der eine Suche in einer Datenbank unternommen 
werden kann, in der Gesamtf lachen von bekannten Sequenzen 
gespeichert sind. Das Feature der Gesamtflache ist zwar fur 
ein Signal weniger charakteristisch, ist dafiir jedoch star- 
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ker komprimiert, so da£ eine kleinere Musikdatenbank und 
eine schnellere Suche moglich. sind. Dieses Feature ist dann 
ausreichend, wenn es noch ausreichend charakteristisch ist. 
An diesem Beispiel zeigt sich die einfach erreiclibare Ska- 
5 lierbarkeit zwischen dem Merkmale der Charakterisierung und 
dem Speicherplatzmerkmal des erf indungsgemaSen Konzepts . 

Alternativ oder zusatzlich zu der Gesamtf lache konnte auch 
die Gesamtenergie einer Sequenz VI, V2 von Fig. 5 einge- 
10 setzt werden. Fur das Energief eature gel ten die vorstehen- 
den Aus f uhrungen ebenso. 

Die erf indungsgemaflen Vorrichtungen und Verfahren konnen 
vorteilhaf terweise urn eine Normierung erganzt werden. Die 

15 Normierung ist insbesondere giinstig, wenn ein Signal einer 
Merkmals-Extraktionsprozedur gemafi der vorliegenden Erfin- 
dung unterzogen wird, um als Merkmal z. B. eine Folge von 
Volumeninf ormationen bzw. Flacheninf ormationen zu erhalten, 
wobei diese Folge, wenn sie eine wiederkehrende Sequenz in 

20 einem Signal ist, wie sie durch vorstehend beschriebene 
Segmentierungsalgorithmen erhalten werden kann, als Urvek- 
tor bezeichnet wird. Wenn z. B. ausgegangen wird, daJ5 ein 
Urvektor eines Signals in einer Datenbank zu Vergleichszwe- 
cken abgespeichert ist, so wurde zur Gewinnung dieses Ur- 

25 vektors ein bestimmter Pegel bzw. eine bestimmte Lautstarke 
des Musiksignals verwendet, um den Urvektor zu generieren. 
Ein Vergleich eines Urvektor, der aus einem Testsignal ab- 
geleitet worden ist, mit dem in der Datenbank gespeicherten 
Urvektor ist dann ohne weiteres moglich, wenn das Testsig- 

30 nal mit den selben Amplitudenverhaltnissen vorliegt, wie 
das Vergleichssignal, von dem der in der Datenbank gespei- 
cherte Urvektor abgeleitet worden ist. In anderen Worten 
ausgedriickt bedeutet dies, dafl ein Urvektor-Vergleich ohne 
weiteres moglich ist, wenn die beiden Signale identische 

35 Signalverlaufe A(t) haben. 

Problematisch wird dies jedoch, wenn das Testsignal, dessen 
Urvektor mit einem in der Datenbank gespeicherten Urvektor 
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verglichen werden soil, lauter abgespielt wird oder leiser 
abgespielt wird. Mathematisch ausgedriickt bedeutet dies, 
daft das Signal A(t), das dem Urvektor in der Datenbank 
zugrunde liegt, nicht gleich dem Testsignal 1st, sondern 
5 daii das Testsignal ein c-faches des Signals ist, also mit 
c-A(t) beschrieben werden kann, wobei c groBer oder kleiner 
1 ist. Ist c grofier als 1, so ist das Testsignal lauter als 
das Datenbanksignal, von dem der Urvektor in der Datenbank 
gespeichert ist. Ist der Faktor c kleiner als 1 und selbst- 
10 verstandlich ungleich Null, so ist das Testsignal leiser 
als das Datenbanksignal. 

Erf indungsgemaft wird daher, urn einen Datenbank-Vergleich 
nicht an Lautstarkeunterschieden scheitern zu lassen bzw. 
15 zu erschweren, eine Normierung des Testsignals und vorzugs- 
weise auch des Datenbanksignals hinsichtlich des Urvektors 
vorgenommen . 

In Figur 6 ist ein beispielhaf ter Signalverlauf A(t) ge- 
20 zeigt. Ein nicht-normierter Urvektor wiirde die Voluminafol- 
gen bzw. Flachenf olgen V12, V23, . .., VI-1, I umfassen. Der 
Urvektor ware dann ein Vektor, der eine Voluminaf olge um- 
faJJt sie vorzugsweise ein Segment ist, die jedoch auch ein 
Teil eines Segments sein konnte. 

25 

Wie es ausgefuhrt worden ist, ist bei einer Streckung des 
Testsignals urn einen Faktor c ein Vergleich mit einem ent- 
sprechenden Urvektor, der von einem Datenbanksignal abge- 
leitet worden ist, problematisch . 

30 

Es wird daher eine Normierung aller Komponenten des Urvek- 
tors vorgenommen, und zwar eine Normierung mit einem Nor- 
mierungswert, der gleich dem Gesamtvolumen aller Einzelvo- 
lumina einer Folge von Volumina entspricht. Das Gesamtvolu- 
35 men einer Folge bzw. eines Urvektors berechnet sich durch 
Addition aller Einzelvolumen in dem Urvektor. Fur das 
nicht-gestreckte Signal erhalt man 
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Vges = V12 + V23 + V34 +...+ Vn-l,n. 

Das Gesamtvo lumen eines mit dem Streckungsf aktor c beauf- 
schlagten gestreckten Signals A'(t)=c-A(t) berechnet sich 
5 f olgendermaBen : 

Vges = C-V12 + C-V23 + ... + c-Vn-l,n. 

Aus dem Vergleich des Gesamtvo lumens fur das gestreckte 
10 Signal Vges mit dem Gesamtvolumen des nicht-gestreckten 
Signal Vges ist zu sehen, daJb diese iiber den Streckungsf ak- 
tor c multiplikativ zusammenhangen . Erfindungsgema.fi wird 
daher eine Normierung jeder einzelnen Koraponente Vi-1, i 
einer Folge von Volumina bzw. Flachen durch das Gesamtvolu- 
15 men bzw. die Gesamtflache der Folge vorgenommen . 

Aus dem gleichungsmafiigen Zusammenhang unterhalb des Dia- 
gramms in Figur 6 ist zu sehen, daJ3 sich durch diese Nor- 
mierung der Streckungsf aktor c herauskurzt, so dafi ein nor- 

20 mierter Urvektor eine hinsichtlich der Lautstarke des Sig- 
nals invariante Grofie ist. In dieser Hinsicht wird es be- 
vorzugt, sowohl den Urvektor, der in der Datenbank gespei- 
chert ist, zu normieren als auch den Urvektor des Testsig- 
nals zu normieren. In diesem Fall sind beide Urvektoren ge- 

25 geniiber jeglichen Amplitudenunterschieden, die durch eine 
multiplikative Streckung mit einem Faktor c beschrieben 
werden kann, invariant, so dali Lautstarkeunterschiede zwi- 
schen einem Testsignal und einem Datenbanksignal unerheb- 
lich sind und eine Musikerkennung nicht beeintrachtigen . 

30 

An dieser Stelle sei darauf hingewiesen, daB ein Urvektor 
nicht unbedingt jedes auf einanderf olgende Volumen in einer 
Seguenz, die segmentiert worden ist , umfassen muss. Je 
nach Anwendung geniigt es auch, z. B. nur jedes zweite bzw. 
35 jedes dritte Volumen einer Seguenz abzuspeichern, urn den 
Speicherbedarf fur die Urvektoren bzw. normierten Urvekto- 
ren zu verringern. In diesem Fall leidet jedoch auch die 
Aussagef ahigkeit, so daft hier ein Kompromifi zu finden sein 
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wird. Sollte eine solcher "luckenhaf ter" Urvektor verwendet 
werden, so wird dieser genauso normiert durch das Gesamtvo- 
lumen des luckenhaf ten Urvektors bzw. die Gesamtf lache des 
liickenhaften Urvektors. Es ist jedoch lediglich wichtig, 
5 daft der in der Datenbank gespeicherte Urvektor, mit dem ein 
Test-Urvektor verglichen werden soil, die selbe „Liickenhaf- 
tigkeit" hat. 

Die erfindungsgemaiien Verfahren zum Charakterisieren, zum 

10 Aufbauen einer Inf ormationssignal-Datenbank oder zum Iden- 
tifizieren eines Test-Inf ormationssignal anhand einer In- 
f ormationssignal-Datenbank konnen je nach vorliegendem Be- 
darf in Hardware oder in Software implementiert werden. Die 
Implementation kann auf einem digitalen Speichermedium, 

15 insbesondere einer Diskette oder CD mit elektronisch aus- 
lesbaren Steuersignalen erfolgen, die so mit einem program- 
mierbaren Computersystem zusammenwirken konnen, daft das 
entsprechende Verfahren ausgefuhrt wird. Allgemein besteht 
die Erfindung somit auch in einem Computer-Programm-Produkt 

20 mit auf einem maschinenlesbaren Trager gespeicherten Pro- 
grammcode zur Durchf iihrung eines oder mehrerer der erfin- 
dungsgemaBen Verfahren, wenn das Computer-Programm-Produkt 
auf einem Rechner ablauf t . In anderen Worten ausgedriickt 
ist die Erfindung somit ein Computer-Programm mit einem 

25 Programmcode zur Durchf iihrung des Verfahrens, wenn das Com- 
puter-Programm auf einem Computer ablauf t. 
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Patentanspriiche 

1 . Vorrichtung zum Charakterisieren eines Inf ormations- 
5 signals, das einen Amplituden-Zeit-Verlauf mit lokalen 

Extremwerten aufweist, mit folgenden Merkmalen: 

einer Einrichtung (10) zum Bestimmen der lokalen Ex- 
tremwerte des Inf ormationssignals, wobei ein lokaler 
10 Extremwert durch einen Zeitpunkt und eine Amplitude 

definiert ist; und 

einer Einrichtung (11) zum Ermitteln von Flacheninf or- 
mationen von Talern oder Bergen des Inf ormationssig- 

15 nals im Falle einer eindimensionalen Amplitude des In- 

f ormationssignals oder von Volumeninf ormationen von 
Talern oder Bergen des Inf ormationssignals im Falle 
einer zweidimensionalen Amplitude des Inf ormationssig- 
nals ,■ wobei ein Tal oder Berg durch einen zeitlichen 

20 Abschnitt (42, 47) des Inf ormationssignals definiert 

ist, wobei sich der Abschnitt des Inf ormationssignals 
von dem Zeitpunkt eines lokalen Extremwerts (43) bis 
zu einem zeitlich benachbarten Wert (44) des Inf orma- 
tionssignals, der die gleiche Amplitude wie der lokale 

25 Extremwert aufweist, erstreckt, wobei die Flachenin- 

formationen oder Volumeninf ormationen von mehreren 
Bergen oder Talern fur das Inf ormationssignal charak- 
teristisch sind. 

3 0 2. Vorrichtung nach Anspruch 1, 

bei der die Einrichtung (10) zum Bestimmen ausgebildet 
ist, um lokale Maxima des Inf ormationssignals zu 
bestimmen, und 

35 

bei der die Einrichtung (11) zum Ermitteln von Fla- 
cheninf ormationen ausgebildet ist, um Flacheninf orma- 
tionen von Talern des Inf ormationssignals zu ermit- 
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teln, wobei ein Tal durch einen zeitlichen Abschnitt 
des Inf ormationssignals definiert ist, der sich von 
dem Zeitpunkt des lokalen Maximums bis zu einem zeit- 
lich benachbarten Wert des Inf ormationssignals er- 
5 streckt, der die gleiche Amplitude wie das lokale Ma- 

ximum hat . 

3. Vorrichtung nach Anspruch 2, 

10 bei der die Einrichtung (11) zum Ermitteln von Fla- 

cheninf ormationen ausgebildet ist, urn Flacheninf orma- 
tionen liber ein Tal (AB2) des Inf ormationssignals, das 
einem lokalen Maximum (41c) zugeordnet ist, das iiber 
einem Tal (ABl ) des Inf ormationssignals vorhanden ist, 

15 dem ein weiteres lokales Maximum (4 Id) mit kleinerer 

Amplitude als das eine lokale Maximum zugeordnet ist, 
so zu bestimmen, daft die Flacheninf ormationen des ei- 
nen Tals (AB2) zusammen mit den Flacheninf ormationen 
des anderen Tals (ABl) auf eine geometrische Flache 

20 zwischen dem Inf ormationssignal und einer oberen Be- 

grenzungslinie des einen Tals (AB2) hinweisen. 

4. Vorrichtung nach einem der vorhergehenden Anspriiche, 

25 bei der die Einrichtung (10) zum Bestimmen ausgebildet 

ist, urn lokale Minima des Inf ormationssignals zu 
bestimmen, und 

bei der die Einrichtung (11) zum Ermitteln von Fla- 
30 cheninformationen ausgebildet ist, urn Flacheninf orma- 

tionen von Bergen des Inf ormationssignals zu ermit- 
teln, wobei ein Berg durch einen zeitlichen Abschnitt 
des Inf ormationssignals definiert ist, der sich von 
dem Zeitpunkt des lokalen Minimums bis zu einem zeit- 
35 lich benachbarten Wert des Inf ormationssignals er- 

streckt, der die gleiche Amplitude wie das lokale Mi- 
nimum hat. 
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5. Vorrichtung nach Anspruch 4, 

bei der die Einrichtung (11) zum Ermitteln von Fla- 
cheninformationen ausgebildet ist, um Flacheninf orma- 
5 tionen iiber einen Berg (Al ' ) des Inf ormationssignals , 

der einem ersten Minimum (45b) zugeordnet ist, der ii- 
ber einem Berg (A21*) des Inf ormationssignals vorhan- 
den ist, dem ein zweites Minimum (45a) mit kleinerer 
Amplitude als das erste Minimum (45b) zugeordnet ist, 
10 so zu bestimmen, daii die Flacheninf ormationen des ers- 

ten Bergs zusammen mit den Flacheninf ormationen des 
zweiten Bergs auf eine geometrische Flache zwischen 
dem Inf ormationssignal und einer unteren Begrenzungs- 
linie des ersten Bergs (A21') hinweisen. 

15 

6. Vorrichtung nach einem der vorhergehenden Anspriiche, 

bei der die Einrichtung zum Ermitteln ausgebildet ist, 
um als Flacheninf ormationen die geometrische Flache 
20 eines Tals oder Bergs, das bzw. der einem lokalen Ex- 

tremwert zugeordnet ist, zu berechnen. 

7. Vorrichtung nach einem der vorhergehenden Anspriiche, 

25 bei der die Einrichtung (11) zum Ermitteln ausgebildet 

ist, um den Flacheninf ormationen fur ein Tal oder ei- 
nen Berg einen Zeitwert zuzuweisen, der dem zeitlichen 
Abschnitt, wodurch den das Tal oder der Berg definiert 
ist, entnommen ist, durch eine Folge von Flacheninf or- 

30 mationen-Zeitwert-Tupeln entsteht . 

8. Vorrichtung nach Anspruch 7, 



35 



bei der der Zeitwert der Zeitpunkt des lokalen Ex- 
tremswerts ist, der dem Tal oder dem Berg zugeordnet 
ist. 
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9. Vorrichtung nach einem der vorhergehenden Anspriiche, 

bei der die Einrichtung (11) zum Ermitteln ausgebildet 
1st, urn als Flacheninf ormationen quantitative Werte zu 
5 ermitteln. 



10. Vorrichtung nach Anspruch 9, 



die ferner folgendes Merkmal aufweist: 

10 

eine Einrichtung (12) zum Nachverarbeiten der Flachen- 
inf ormationen von mehreren Bergen oder Talern . 



11. Vorrichtung nach Anspruch 10, 

15 

bei der die Einrichtung (12) zum Nachverarbeiten aus- 
gebildet ist, um Berge oder Taler, deren Flacheninf or- 
mationen kleiner als ein vorbestimmter Schwellenwert 
sind, bei einer weiteren Verarbeitung zu unterdriicken . 

20 

12. Vorrichtung nach Anspruch 10 oder 11, 



bei der die Einrichtung (12) zum Nachverarbeiten aus- 
gebildet ist, um eine Folge von Flacheninf ormations- 
veranderungen durch Bestimmen eines Verhaltnisses von 
jeweils zeitlich auf einanderf olgenden Flacheninf orma- 
tionen oder durch Bilden einer Differenz zwischen zwei 
jeweils auf einanderf olgenden Flacheninf ormationen zu 
ermitteln. 

13. Vorrichtung nach Anspruch 10, 11 oder 12, 

bei der die Einrichtung (12) zum Nachverarbeiten aus- 
gebildet ist, um die Folge von Flacheninf ormationen 
nach sich wiederholenden Sequenzen von Flacheninf orma- 
tionen zu untersuchen. 
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14. Vorrichtung nach Anspruch 13, 

bei der die Einrichtung (12) zum Nachverarbeiten aus- 
gebildet ist, um das Inf ormationssignal gemaJi sich 
5 wiederholenden Sequenzen zu segmentieren . 

15. Vorrichtung nach einerti der Anspriiche 10 bis 14, 

bei der die Einrichtung (12) zum Nachverarbeiten aus- 
gebildet ist, um Kombinationspaare von identischen 
Flacheninformationen oder von Flacheninf ormationen die 
sich weniger als eine vorbestimmte Toleranz unter- 
scheiden, zu bestimmen, und um anhand einer Zeitdiffe- 
renz zwischen Zeitpunkten der Flacheninformationen ei- 
nes Kombinationspaars eine Frequenzinf ormation liber 
das Inf ormationssignal zu berechnen . 

16. Vorrichtung nach einem der Anspriiche 10 bis, 12, 

bei der die Einrichtung (12) zum Nachverarbeiten aus- 
gebildet ist, um abrupte Flacheninf ormationsanderungen 
in der Folge von Flacheninformationen zu bestimmen, 
und um bei abrupten Flacheninf ormationsanderungen das 
Inf ormationssignal zu segmentieren. 

17. Vorrichtung nach einem der Anspriiche 10 bis 16, 

bei der die Einrichtung (12) zum Nachverarbeiten aus- 
gebildet ist, um Flacheninformationen zu normieren, um 
eine Folge von normierten Flacheninformationen zu er- 
halten . 

18. Vorrichtung nach einem der Anspriiche 10 bis 17, 

bei der die Einrichtung (12) zum Nachverarbeiten aus- 
gebildet ist, um unter Verwendung der Flacheninforma- 
tionen und von zugeordneten Zeitpunkten eine longitu- 
dinale Ausdehnung von Bergen oder Talern zu erhalten, 
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urn bestimmen zu konnen, ob es sich bei dem Informati- 
onssignal urn ein Audiosignal mit einer Sprache oder 
einer Instrumentenmusik handelt. 

5 19. Vorrichtung nach einem der vorhergehenden Anspruche, 

bei der Einrichtung (11) zum Ermitteln ausgebildet 
ist, urn eine Folge von Flacheninf ormationen oder Volu- 
meninf ormationen zu ermitteln, 

wobei die Vorrichtung ferner eine Normierungseinrich- 
tung aufweist, die ausgebildet ist, um durch Addition 
von zumindest zwei Elementen der Folge von Flachenin- 
formationen oder Volumeninf ormationen eine Gesamtfla- 
che oder ein Gesamtvolumen zu berechnen, und die fer- 
ner ausgebildet ist, um die Elemente der Folge durch 
die Gesamtflache oder das Gesamtvolumen zu dividieren, 
um eine normierte Folge zu erhalten. 

20 . Vorrichtung nach Anspruch 19, 

bei der die Normierungseinrichtung ausgebildet ist, um 
alle Elemente eines Segments der Folge auf zusummieren, 
wobei ein Segment ein Urmuster darstellt, das sich in 
einer unsegmentierten Folge wiederholt . 

21. Verfahren zum Aufbauen einer Inf ormationssignal- 
Datenbank (22), mit folgenden Schritten: 

Charakterisieren (20) eines Inf ormationssignals , das 
einen Amplituden-Zeit-Verlauf mit lokalen Extremwerten 
aufweist, um Flacheninf ormationen fur ein Informati- 
onssignal zu erhalten, gemaB einem der Patentansprtiche 
1 bis 18; 

Zufuhren (21) mehrerer Inf ormationssignale zu der Vor- 
richtung (20) zum Charakterisieren, um fur jedes In- 
formations signal einen Merkmalsvektor (MMl, MM2, MM3) 
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zu erhalten, der von den Flacheninf ormationen fur das 
Inf ormationssignal abgeleitet ist; und 



Speichern (23) von Merkmalsvektoren (MM1, MM2, MM3) 
5 fur die Inf ormationssignale, wobei jedem Merkmalsvek- 

tor ein Identif ikator (IDl, ID2, ID3) des Informati- 
onssignals zugeordnet ist, aus dem der jeweilige Merk- 
malsvektor ermittelt worden ist. 



10 22. Vorrichtung zum Identif izieren eines Inf ormationssig- 
nals unter Verwendung einer Inf ormationssignal- 
Datenbank (22) , die Merkmalsvektoren (MM1, MM2, MM3) 
in Zuordnung zu jeweiligen Inf ormationssignalidentif i- 
katoren (IDl, ID2, ID3) speichert, mit folgenden Merk- 



einer Vorrichtung zum Charakterisieren eines Informa- 
tionssignals, das einen Amplituden-Zeit-Verlauf mit 
lokalen Extremwerten aufweist, gemafi einem der Anspru- 
che 1 bis 18, um Flacheninf ormationen von mehreren 
Bergen oder Talern zu erhalten, die fur das Informati- 
onssignal charakteristisch sind; und 

einer Einrichtung zum Vergleichen eines Merkmalsvek- 
tors, der von den Flacheninf ormationen oder Vblumenin- 
formationen abgeleitet ist, die fiir ein Test- 
Inf ormationssignal charakteristisch sind, mit in der 
Inf ormationssignal-Datenbank (22) gespeicherten Merk- 
malsvektoren, um eine Aussage tiber das Informations- 
signal zu treffen. 

Verfahren zum Identif izieren eines Inf ormationssignals 
unter Verwendung einer Inf ormationssignal-Datenbank 

(22), die Merkmalsvektoren (MM1, MM2, MM3) in Zuord- 
nung zu jeweiligen Inf ormationssignalidentif ikatoren 

(IDl, ID2, ID3) speichert, mit folgenden Schritten: 
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Charakterisieren eines Inf ormationssignals, das einen 
Amplituden-Zeit-Verlauf mit lokalen Extremwerten auf- 
weist, gemafl einem der Anspriiche 1 bis 18, urn Flachen- 
informationen von mehreren Bergen oder Talern zu er- 
5 halten, die fur das Inf ormationssignal charakteris- 

tisch sind; und 

Vergleichen eines Merkmalsvektors , der von den Fla- 
cheninformationen oder Volumeninf ormationen abgeleitet 
10 ist, die fur ein Test-Inf ormationssignal charakteris- 

tisch sind, mit in der Inf ormationssignal-Datenbank 
(22) gespeicherten Merkmalsvektoren, urn eine Aussage 
iiber das Inf ormationssignal zu treffen. 



15 24. 



Computer-Programm mit einem Programmcode zum Durchfuh- 
ren eines Verfahrens nach einem der Anspriiche 19, 21 
oder 23, wenn das Programm auf einem Computer ablauft. 
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Streckungsfaktor c'; V ges =Vi 2+V23+" 

V , ges=c-V 1 2+cV 2 3-cVges 




ERSATZBLATT (REGEL 26) 



